Extraction des connaissances pour l'enrichissement des bases de données géographiques
نویسندگان
چکیده
Utilisés de façon croissante depuis une quinzaine d'années, les Systèmes d'Informations Géographiques (SIG) permettent le stockage, l'interrogation, la manipulation, le partage, la diffusion et la restitution d'informations à composante géographique, telles que les villes, les rues ou les fleuves. Un SIG comme son nom l’indique traite principalement des aspects cartographiques. Dans une situation où l’utilisateur désire obtenir des informations d’ordre économiques, historiques, etc..., le SIG ne peut être à lui tout seul suffisant. D'où, la nécessité d'un enrichissement sémantique des bases de données géographiques manipulées, ces systèmes deviennent alors des sources riches de données. Dans ce contexte, nous profitons des informations abondantes sur le Web pour ajouter des informations complémentaires aux SIG. En fait, le volume d'informations disponibles sur Internet ne cessant d'augmenter chaque jour, on utilisera la technique du textmining pour permettre à partir des textes du web d'extraire et d'expliciter l'essentiel de l'information et ce sous forme de résumés. L’application de ces techniques d'analyse textuelle est initiée en fournissant des éléments localisés par pointé ou fenêtrage via le SIG. Par la suite, un accès au Web prend lieu pour le téléchargement des documents pertinents. La résolution de ce problème se réalise d’une manière distribuée entre un ensemble d’agents interagissant, afin, de générer le meilleur résumé. Un agent interface qualifié de méta-agent est créé par le système. Cet agent crée à son tour des agents summarizer (autant d’agents summarizer que de documents). Chacun de ces agents prend à sa charge la segmentation du texte de son document en fixant les frontières thématiques. Une fois les segments cernés, ils sont envoyés à l’agent interface qui se met à les regrouper ensemble selon le degré de similarité des thèmes. Par la suite, il affecte un délégué pour chaque thème et ce en tenant compte du coût engendré par sa décision. Il s’agit en fait de minimiser la surcharge de chaque délégué tout en distribuant au maximum la tâche de génération de résumés entre le plus grand nombre d’agents. A l’issue de cette décision chaque délégué doit interagir avec ses accointances (les agents qui traitent le(s) thème(s) sous sa responsabilité) par envoi de messages afin de collecter les segments correspondants. Désormais, le délégué tient à sa disposition un document virtuel. Il est appelé ainsi puisqu’il ne résulte pas d’une tâche de recherche d’informations, mais, de la collecte de segments issus des différents agents summarizer. Enfin, chaque délégué extrait les informations les plus saillantes qui résument mieux ses documents virtuels. Le résumé final résulte de l’assemblage des résumés partiels générés par chaque agent délégué. Ce résumé final étant transféré au SIG.
منابع مشابه
L'apport de l'information spatiale pour l'enrichissement des bases de données
RÉSUMÉ. Dans ce papier, nous présentons une approche d’acquisition de connaissances pour l’enrichissement des contenus des bases de données géographiques. L’enrichissement peut s’opérer à travers l’intégration et la fusion de données de sources différentes. L’approche que nous préconisons génère des résumés à partir d’un corpus de documents en provenance du web. Nous faisons collaborer un ensem...
متن کاملUne approche distribuée pour l'extraction de connaissances: application à l'enrichissement de l'aspect factuel des BDG
Résumé. Les systèmes d’informations géographiques (SIG) sont utilisés pour améliorer l’efficacité des entreprises et des services publics, en associant méthodes d’optimisation et prise en compte de la dimension géographique. Cependant, les bases de données géographiques (BDG) stockées dans les SIG sont restreintes à l’application pour laquelle elles ont été conçues. Souvent, les utilisateurs de...
متن کاملDu texte à la base de données géographiques
Résumé. Avec la prolifération des données géographiques, il y a un fort besoin de concevoir des outils automatiques pour l’exploitation des connaissances géographiques incarnées dans les documents textuels. C’est dans ce contexte, que nous proposons une approche permettant de générer une base de données géographiques (BDG) à partir de textes. Notre approche s’articule autour de deux grandes pha...
متن کاملTraitement et exploration du fichier Log du Serveur Web pour l'extraction des connaissances : Web Usage Mining
Résumé : Le but dans ce travail consiste à concevoir et réaliser un Outil, en se basant sur l’ECD (Extraction de la Connaissance a partir de bases de données), en utilisant les concepts du Web Usage Mining, pour offrir aux web masters l’ensemble des connaissances, y inclut les statistiques sur leurs sites, afin de prendre les bonnes décisions. Il s’agit en faite, d’extraire de l’information à p...
متن کاملConnaissances opérationnelles pour la conception automatique de légendes de cartes
Résumé : La réalisation d’une légende de carte topographique est un processus qui fait appel à de nombreux domaines de connaissances. L’objectif du travail présenté est de permettre à des utilisateurs de créer des cartes sur mesure, en particulier de les aider à concevoir des légendes cartographiquement correctes et adaptées à leurs goûts et à leurs besoins. Pour cela, il est nécessaire de list...
متن کامل